Challenge #72: Compare Data Sets (Fields/Columns) ~データセットの比較~ – Alteryx Weekly Challenge
こんにちは。Alteryxサポートエンジニアとして勉強中のスズです。
当エントリは『Alteryx Weekly Challenge:Intermediate Level Advent Calendar 2018』の23日目です。
- Alteryx Weekly Challenge:Intermediate Level Advent Calendar 2018 - Qiita
- Alteryx Weekly Challenge:Intermediate Level Advent Calendar 2018 | シリーズ | Developers.IO
『Alteryx Weekly Challenge:Intermediate Level Advent Calendar 2018』では、Alteryx Communityで公開されているWeekly ChallengeのIntermediate Levelにひたすら1人で挑戦していきます。
今回はデータセットの比較に挑戦します。
動作環境
当エントリの執筆には、以下の環境を利用しています。
- Windows 10 Pro
- Alteryx Designer 2018.4.4.54346 英語版
Challenge #72: Compare Data Sets (Fields/Columns)
お題
今回挑戦するお題はこちら。
※配布されているワークフローに69と記載されていますが、72番のお題です。
「Input」側には2つデータが用意されています。1つ目のデータはこちら。
2つ目のデータはこちら。
「Output」側のデータはこちら。2つのデータのフィールド名を比較しています。
解答の概要
今回作成するワークフローは以下の通りです。
- フィールド名の準備
- フィールド名の比較
フィールド名の準備
2つのデータに対して処理を行いますが、使用するツールと設定は共通しています。
Transposeツール(Transform -> Transpose)を使用して、データを縦持ちに変換します。
Uniqueツール(Preparation -> Unique)を使用して、フィールド名を抽出します。
Record IDツール(Preparation -> Record ID)を使用して、IDを付与します。
Data Cleansingツール(Preparation -> Data Cleansing)を使用して、フィールド名を全て大文字に変換し、アンダースコアや空白を取り除きます。
Joinツール(Join -> Join)を使用して、元のフィールド名と大文字に変換したフィールド名を結合します。不要な列の削除と、元のフィールド名がある列の名前を設定します。
これで元のフィールド名と大文字に変換したフィールド名を準備できました。
フィールド名の比較
Joinツールを使用して2つのデータを結合します。データの結合には、大文字に変換したフィールド名を使用します。
Unionツール(Join -> Union)を使用して、Joinツールの L と J と R から出力されるデータを結合します。データの結合には Auto Config by Name を使用しています。
Selectツール(Preparation -> Select)を使用して、不要な列を削除します。
結果を確認して完成です。
最後に
今回はWeekly ChallengeのChallenge #72: Compare Data Sets (Fields/Columns)に挑戦しました。
明日もお楽しみに!
サンプルワークフローのご案内
クラスメソッドでご契約のユーザー様向けに、当ブログでご紹介したワークフローを専用ポータルにて公開しております。当エントリでご紹介したワークフローも公開予定ですので、ご参考にしていただきますと幸いです。
Alteryxの導入なら、クラスメソッドにおまかせください
日本初のAlteryxビジネスパートナーであるクラスメソッドが、Alteryxの導入から活用方法までサポートします。14日間の無料トライアルも実施中ですので、お気軽にご相談ください。